智能论文笔记

Original or Translated? On the Use of Parallel Data for Translation Quality Estimation

Baopu Qiu , Liang Ding , Di Wu , Lin Shang , Yibing Zhan , Dacheng Tao

分类：自然语言处理

2022-12-20

Machine Translation Quality Estimation (QE) is the task of evaluating translation output in the absence of human-written references. Due to the scarcity of human-labeled QE data, previous works attempted to utilize the abundant unlabeled parallel corpora to produce additional training data with pseudo labels. In this paper, we demonstrate a significant gap between parallel data and real QE data: for QE data, it is strictly guaranteed that the source side is original texts and the target side is translated (namely translationese). However, for parallel data, it is indiscriminate and the translationese may occur on either source or target side. We compare the impact of parallel data with different translation directions in QE data augmentation, and find that using the source-original part of parallel corpus consistently outperforms its target-original counterpart. Moreover, since the WMT corpus lacks direction information for each parallel sentence, we train a classifier to distinguish source- and target-original bitext, and carry out an analysis of their difference in both style and domain. Together, these findings suggest using source-original parallel data for QE data augmentation, which brings a relative improvement of up to 4.0% and 6.4% compared to undifferentiated data on sentence- and word-level QE tasks respectively.

translated by 谷歌翻译

SuperVessel: Segmenting High-resolution Vessel from Low-resolution Retinal Image

Yan Hu , Zhongxi Qiu , Dan Zeng , Li Jiang , Chen Lin , Jiang Liu

分类：计算机视觉

2022-07-28

血管分割从图像中提取血管，并作为诊断各种疾病的基础，例如眼科疾病。眼科医生通常需要高分辨率分割结果进行分析，这会导致大多数现有方法的超计算负载。如果基于低分辨率的输入，它们很容易忽略微小的容器或引起分段容器的不连续性。为了解决这些问题，本文提出了一种名为Subersessel的算法，该算法使用低分辨率图像作为输入提供了高分辨率和准确的容器分割。我们首先将超分辨率作为我们的辅助分支，以提供潜在的高分辨率细节特征，可以在测试阶段删除。其次，我们提出了两个模块，以增强感兴趣的分割区域的特征，包括具有特征分解（UFD）模块的上采样和功能相互作用模块（FIM），并限制了损失，以关注感兴趣的功能。与其他最先进的算法相比，在三个公开数据集上进行了广泛的实验表明，我们提出的Supersess可以将更高的细分精度分割为6％以上的细分精度。此外，Supercessel的稳定性也比其他算法更强。发表论文后，我们将发布代码。

translated by 谷歌翻译

Prototype-Guided Continual Adaptation for Class-Incremental Unsupervised Domain Adaptation

Hongbin Lin , Yifan Zhang , Zhen Qiu , Shuaicheng Niu , Chuang Gan , Yanxia Liu , Mingkui Tan

分类：计算机视觉

2022-07-22

本文研究了一个新的，实用但具有挑战性的问题，称为类无监督的域名适应性（CI-UDA），其中标记的源域包含所有类别，但是未标记的目标域中的类别依次增加。由于两个困难，这个问题具有挑战性。首先，源和目标标签集在每个时间步骤都不一致，这使得很难进行准确的域对齐。其次，以前的目标类在当前步骤中不可用，从而忘记了先前的知识。为了解决这个问题，我们提出了一种新型的原型引导连续适应（PROCA）方法，由两种解决方案策略组成。 1）标签原型识别：我们通过检测具有目标样本的累积预测概率的共享类来识别目标标签原型。 2）基于原型的对齐和重播：基于确定的标签原型，我们对齐域并强制执行模型以保留先前的知识。有了这两种策略，ProCA能够有效地将源模型改编为类未标记的目标域。广泛的实验证明了Proca在解决CI-UDA方面的有效性和优势。源代码可从https://github.com/hongbin98/proca.git获得

translated by 谷歌翻译

CKD-TransBTS: Clinical Knowledge-Driven Hybrid Transformer with Modality-Correlated Cross-Attention for Brain Tumor Segmentation

Jianwei Lin , Jiatai Lin , Cheng Lu , Hao Chen , Huan Lin , Bingchao Zhao , Zhenwei Shi , Bingjiang Qiu , Xipeng Pan , Zeyan Xu

分类：计算机视觉

2022-07-15

磁共振图像（MRI）中的脑肿瘤分割（BTS）对于脑肿瘤诊断，癌症管理和研究目的至关重要。随着十年小型挑战的巨大成功以及CNN和Transformer算法的进步，已经提出了许多出色的BTS模型来解决BTS在不同技术方面的困难。但是，现有研究几乎没有考虑如何以合理的方式融合多模式图像。在本文中，我们利用了放射科医生如何从多种MRI模态诊断脑肿瘤的临床知识，并提出了一种称为CKD-TRANSBTS的临床知识驱动的脑肿瘤分割模型。我们没有直接串联所有模式，而是通过根据MRI的成像原理将输入方式分为两组来重新组织输入方式。具有拟议模态相关的跨意义块（MCCA）的双支支混合式编码器旨在提取多模式图像特征。所提出的模型以局部特征表示能力的能力来继承来自变压器和CNN的强度，以提供精确的病变边界和3D体积图像的远程特征提取。为了弥合变压器和CNN功能之间的间隙，我们提出了解码器中的反式和CNN功能校准块（TCFC）。我们将提出的模型与五个基于CNN的模型和六个基于Transformer的模型在Brats 2021挑战数据集上进行了比较。广泛的实验表明，与所有竞争对手相比，所提出的模型可实现最先进的脑肿瘤分割性能。

translated by 谷歌翻译

MIMO-DoAnet: Multi-channel Input and Multiple Outputs DoA Network with Unknown Number of Sound Sources

Haoran Yin , Meng Ge , Yanjie Fu , Gaoyan Zhang , Longbiao Wang , Lei Zhang , Lin Qiu , Jianwu Dang

分类：机器学习

2022-07-15

最近基于神经网络的到达方向（DOA）估计算法在未知数的声源场景上表现良好。这些算法通常是通过将多通道音频输入映射到单个输出（即所有来源的总空间伪谱（SP））来实现的，称为MISO。但是，这种误语算法在很大程度上取决于经验阈值设置和声音源之间的角度大于固定角度的角度假设。为了解决这些局限性，我们提出了一种新型的多通道输入和多个输出的DOA网络，称为MIMO-DOANET。与一般的误觉算法不同，Mimo-Doanet借助于信息的空间协方差矩阵预测了每个声源的SPS编码。通过这样做，检测声源数量的阈值任务成为检测每个输出中是否存在声音源的更容易的任务，并且在推理阶段，声源之间的严重交互消失。实验结果表明，与3，4个来源场景中的莫斯科基线相比，MIMO-DOANET的相对增长18.6％和绝对13.3％，相对34.4％和绝对20.2％的F1得分提高。结果还证明了Mimo-Doanet减轻了阈值设置问题，并有效地解决了角度假设问题。

translated by 谷歌翻译

HoVer-Trans: Anatomy-aware HoVer-Transformer for ROI-free Breast Cancer Diagnosis in Ultrasound Images

Yuhao Mo , Chu Han , Yu Liu , Min Liu , Zhenwei Shi , Jiatai Lin , Bingchao Zhao , Chunwang Huang , Bingjiang Qiu , Yanfen Cui

分类：计算机视觉

2022-05-17

超声检查是乳腺癌诊断的重要常规检查，这是由于其无创，无辐射和低成本的特性。但是，由于其固有的局限性，乳腺癌的诊断准确性仍然受到限制。如果我们可以通过乳房超声图像（BUS）精确诊断乳腺癌，那将是一个巨大的成功。已经提出了许多基于学习的计算机辅助诊断方法来实现乳腺癌诊断/病变分类。但是，其中大多数需要预定的ROI，然后对ROI内的病变进行分类。常规的分类骨架，例如VGG16和RESNET50，可以在没有ROI要求的情况下获得有希望的分类结果。但是这些模型缺乏解释性，因此限制了它们在临床实践中的使用。在这项研究中，我们提出了一种具有可解释特征表示的超声图像中乳腺癌诊断的新型无ROI模型。我们利用解剖学的先验知识，即恶性肿瘤和良性肿瘤在不同的组织层之间具有不同的空间关系，并提出了悬停转换器来提出这种先验知识。提出的悬停式跨界块水平和垂直地提取层间和层内空间信息。我们进行并释放一个开放的数据集GDPH＆SYSUCC，以用于公共汽车中的乳腺癌诊断。通过与四个基于CNN的模型和两个Vision Transformer模型进行比较，通过五倍的交叉验证来评估所提出的模型。它通过最佳模型可解释性实现最新的分类性能。同时，我们提出的模型在仅给出一张公交图像时，在乳腺癌诊断方面优于两名高级超声检查员。

translated by 谷歌翻译

Achieving an Accurate Random Process Model for PV Power using Cheap Data: Leveraging the SDE and Public Weather Reports

Yiwei Qiu , Jin Lin , Zhipeng Zhou , Ningyi Dai , Feng Liu , Yonghua Song

分类：机器学习

2021-11-27

基于随机差分方程（SDE）的挥发性可再生能源（RESS）的随机过程模型共同捕获了连续时间的不断变化的概率分布和时间相关性。它已经使最近的研究能够显着提高动力系统动态不确定性量化和优化的性能。然而，考虑到PV的非同质随机过程性质，仍然存在一个具有挑战性的问题：如何获得用于光伏电源的现实和准确的SDE模型，以反映其在线操作中的天气不确定性，特别是在高分辨率数值时天气预报（NWP）对于许多分布式工厂不可用？为了填补这个差距，本文发现，只有使用来自低分辨率公共天气报告的廉价数据，可以构建精确的PV电源SDE模型。具体地，构建每小时参数化的Jacobi扩散过程以在一天内重新创建PV挥发性的时间模式。它的参数使用极端学习机（ELM）的集合来映射到公共天气报告，以反映不同的天气状况。 SDE模型共同捕捉盘流道和陷阱。基于澳门收集的现实数据的统计检验表明，所提出的方法优于一系列最先进的深度学习的时间系列预测方法。

translated by 谷歌翻译

Persia: A Hybrid System Scaling Deep Learning Based Recommenders up to 100 Trillion Parameters

Xiangru Lian , Binhang Yuan , Xuefeng Zhu , Yulong Wang , Yongjun He , Honghuan Wu , Lei Sun , Haodong Lyu , Chengjun Liu , Xing Dong

分类：机器学习

2021-11-10

基于深度学习的模型占主导地位的生产推荐系统的当前景观。此外，近年来目睹了模型规模的指数增长 - 从谷歌的2016年模型，最新的Facebook的型号有10亿个参数，具有12万亿参数。型号容量的每次跳跃都有显着的质量增强，这使我们相信100万亿参数的时代即将来临。然而，即使在工业规模数据中心内，这些模型的培训也在挑战。这种困难是从训练计算的惊人的异质性继承 - 模型的嵌入层可以包括总模型尺寸的99.99％，这是极其内存密集的;虽然其余的神经网络越来越多地计算密集型。为支持培训此类巨大模式，迫切需要有效的分布式培训系统。在本文中，我们通过仔细共同设计优化算法和分布式系统架构来解决这一挑战。具体而言，为了确保培训效率和训练精度，我们设计一种新型混合训练算法，其中嵌入层和密集的神经网络由不同的同步机制处理;然后，我们构建一个名为Persia的系统（短暂的并行推荐培训系统，其中包含混合加速），以支持这种混合培训算法。理论上的示范和实证研究均达到100万亿参数，以证明了波斯的系统设计和实施。我们将Pensia公开使用（在https://github.com/persiamml/persia），以便任何人都能够以100万亿参数的规模轻松培训推荐模型。

translated by 谷歌翻译

Learning Logic Rules for Document-level Relation Extraction

Dongyu Ru , Changzhi Sun , Jiangtao Feng , Lin Qiu , Hao Zhou , Weinan Zhang , Yong Yu , Lei Li

分类：自然语言处理

2021-11-09

文件级关系提取旨在识别整个文件中实体之间的关系。捕获远程依赖性的努力大量依赖于通过（图）神经网络学习的隐式强大的表示，这使得模型不太透明。为了解决这一挑战，在本文中，我们通过学习逻辑规则提出了一种新的文档级关系提取的概率模型。 Logire将逻辑规则视为潜在变量，包括两个模块：规则生成器和关系提取器。规则生成器是生成可能导致最终预测的逻辑规则，并且关系提取器基于所生成的逻辑规则输出最终预测。可以通过期望最大化（EM）算法有效地优化这两个模块。通过将逻辑规则引入神经网络，Logire可以明确地捕获远程依赖项，并享受更好的解释。经验结果表明，Logire在关系性能（1.8 F1得分）和逻辑一致性（超过3.3逻辑得分）方面显着优于几种强大的基线。我们的代码可以在https://github.com/rudongyu/logire提供。

translated by 谷歌翻译

Magnetic Resonance Spectroscopy Deep Learning Denoising Using Few In Vivo Data

Dicheng Chen , Wanqi Hu , Huiting Liu , Yirong Zhou , Tianyu Qiu , Yihui Huang , Zi Wang , Jiazheng Wang , Liangjie Lin , Zhigang Wu

分类：机器学习

2021-01-26

磁共振光谱（MRS）是揭示代谢信息的无创工具。 1H-MRS的一个挑战是低信号噪声比（SNR）。为了改善SNR，一种典型的方法是用M重复样品进行信号平均（SA）。但是，数据采集时间相应地增加了M次，并且在公共环境M = 128时，完整的临床MRS SCAN大约需要10分钟。最近，引入了深度学习以改善SNR，但大多数人将模拟数据用作培训集。这可能会阻碍MRS应用程序，因为某些潜在差异（例如获取系统的缺陷）以及模拟和体内数据之间可能存在生理和心理条件。在这里，我们提出了一种新方案，该方案纯粹使用了现实数据的重复样本。深度学习模型，拒绝长期记忆（RELSTM），旨在学习从低SNR时间域数据（24 SA）到高SNR ONE（128 SA）的映射。对7个健康受试者，2名脑肿瘤患者和1名脑梗塞患者的体内脑光谱进行实验表明，仅使用20％的重复样品，RelstM的DeNoed Spectra可以为128 SA提供可比的代谢物。与最先进的低级别去核法相比，RELSTM在量化某些重要的生物标志物时达到了较低的相对误差和cram \'er-rao下限。总而言之，RELSTM可以在快速获取（24 SA）下对光谱进行高保真降级，这对MRS临床研究很有价值。

translated by 谷歌翻译